當我們拿到一份資料時,往往其中有許多缺失值
以下我會介紹如何檢視及各缺失值處理方式
我先建立各raw及columns都有些缺失值的DataFrame
isnull與notnull方法:
isnull將資料空值回傳True,不是空值回傳False
notnull則相反,資料空值回傳False,不是空值回傳True
drop:
drop可用來拿掉你指定的raw或column
axis參數預設為0,axis=0時drop掉raw、axis=1時drop掉column
拿掉0、1這兩個raw
拿掉one,thr這兩個column
dropna:
dropna可拿掉有遺失值的raw
與drop一樣,axis預設為0
axis=0時drop掉有空值的raw、axis=1時drop掉有空值的column
只有index是4的那排raw沒有遺失值,所以只剩下那排
因為全部的column都有遺失值,所以輸出結果如此
fillna補充缺失值:
方式一:以字典的方式傳入,前面是column名稱,後面是補充缺失值的值
方式二:單一欄位補充缺失值
送上colab連結,可自行在上面多做點練習更加熟悉pandas
https://colab.research.google.com/drive/1xM9yP5PgwyZPdopvrRz62f8M2lwq_S9P?usp=sharing
pandas就先講到這邊,這些東西應該已經夠用了,以後有遇到新的方法再繼續學習吧!